靠特徵模式就可以識別圖像
特徵樣式正是神經網路分辦圖像的原理。這種像素的模式又叫做「用來分辦狗和貓的特徵模式(feature pattern)。事實上,就算是外貌稍有不同的狗或貓,我們仍可透過有沒有特徵樣式來辨別對象是狗還是貓。
以下將簡單說明為何如此。
當我們讀取一張新的圖像時,會透過以下的機制辦認出圖像中的動物是狗。下圖中,圖像中的黑色鼻子與狗的特徵樣式「黑鼻頭」一致,但圖像中卻沒有和貓的特徵樣式一致的部分。
透過上述的內容,神經網路可以是別出新輸入的圖像是狗,簡單來說就是只靠特徵去判斷。
如前所述,只要檢查特徵樣式的部分,就可以識別出這張圖像是狗還是貓。
因此這裡就讓我們用隱藏層中的三個神經元,分别負責檢查這三種特徵樣式吧
隱藏層最上面的神經元(簡稱1號)負責偵測圖像中是否有「黑鼻頭」。同樣的,隱藏層從上算起的第二、第三個神經元(簡稱2號、3號)分別負責偵測圖像中是否有「左右鬍鬚」、「w嘴」。分配好各個神經元的工作後,就用箭頭連接起輸入層、隱藏層、輸出層,如下所示。
輸出層中,從第一個是「看到『狥』的圖像時會産生反應」的神經元,因此它會和隱藏層中負責偵測「黑鼻頭」的1號用箭頭相連。
輪出層中,從第二個是「看到『貓』的圖像時會產生反應」的神經元機器人,因此它會和隱藏層中負責偵測「左右鬍鬚」、「w嘴」的2號、3號用箭頭相連。
要注意的是,正常來說任一要素都應該要連結到相鄰層的每個要素才對。不過其他箭頭細到可以忽略,所以只保留剩下的箭頭。
接下來,讓我們試著把剛才的狗的圖像放入輸入層的記憶體內讀取。如下一頁的圖所示,由「黑鼻頭」這個特徵所發送出來的訊號會經過較粗的箭頭,傳送到「會對狗的圖像產生反應」的輸出層神經元。
相對的,這張圖並没有貓的特徵「w嘴」、「鬍鬚」,不會發送出相關訊號,所以「會對貓的圖像產生反應」的輸出層神經元2不會收到任何訊號。
就這樣,輸入層讀取狗的圖像時,會傳送較強的訊號給輸出層的神經元1,使「會對狗反應」的神經元1產生反應。相對的,「面對貓反應」的神經元2則不會反應。因此,只要看輸出層中這兩個神經元機器人的反應情況,就可以判斷出輸入的圖像是狗。
由以上過程可以得知,「即使是單純的機制,只要能建構成網路,就能擁有智慧」。